À la fin de cette Boîte à outils, on obtient pour chaque rubrique (en CAPITALES) les fichiers avec les extensions suivantes : _treetagger.xml ; txt ; xml et cnr (la sortie de cordial qui porte un 1 car il a fallu transformer les retour chariot Unix en retours chariot Windows et repasser en Latin1).
Une fois la transformation faite (fichier par fichier et à la main pour Cordial qui demande et donne un fichier en latin-1) et automatiquement par le script d'étiquetage avec Tree-tagger (qui donne directement un fichier xml en UTF-8)
On obtient quelque chose comme ceci :Il ne reste plus qu'à transformer ce fichier xml en tableau et à ajouter des couleurs pour bien distinguer la forme (en rouge), le lemme (en noir) et sa catégorie grammaticale (en bleu).
Voici le résultat :